|
Die Einsatzmöglichkeiten künstlicher neuronaler Netze zur
Klangerkennung wurden in dieser Studienarbeit anhand von zwei
Teilaufgaben untersucht: Die Erkennung der Klasse von
Musikinstrumenten (z.B. Streicher) und die Sprecheridentifikation am
Klang der Stimme.
Dazu wurde ein Versuchssystem entwickelt, das die Aufbereitung und
Vorverarbeitung der Audiodaten, die Erzeugung von Trainingsmustern
für neuronale Netze, die Durchführung des Trainings mit dem
Stuttgarter Neuronale Netze Simulator (SNNS) und die Auswertung der
Ergebnisse weitgehend automatisiert.
Mit dem Versuchssystem wurden verschiedene Vorverarbeitungsarten
(Fouriertransformation, logarithmiertes Leistungsspektrum,
Melscale-Transformation, LPC-Transformation), Netztopologien
(Feedforward-Netze, partiell rekurrente Elman-Netze, Time Delay
Neural Networks) und Lernverfahren (Backpropagation, Resilient
Propagation (RProp)) auf ihre Tauglichkeit zur Klanganalyse hin
untersucht.
Bei der Instrumentenerkennung wurden bis zu 94.59% der Testdaten
richtig erkannt. Bei der Sprecheridentifikation wurde sowohl bei der
textabhängigen als auch bei der textunabhängigen Identifikation
eine Erkennungsleistung von 100% erreicht bei einer Datenbasis von
15 Sprechern und Sprecherinnen. Die Sprecheridentifikation unter dem
Einfluß von Störgeräuschen erreichte je nach deren Lautstärke
95.51% bzw. 98.44% richtig erkannte Sprecher.
|